説文解字注データ
説文解字注データは、段玉裁の「説文解字注」をUCSで符号化することを目指します。2010年現在、親字・本文はほぼ全て入力されていますが、注にはまだ完全に入力されていない箇所が残っています。
UCSにない異体字については、UCSにある文字の脇にXMLコメントでIDSを併記します(例:『礚<!--⿰石葢-->』)。これによって、XML編集レベルでは異体字をできるだけ記録すると同時に、XML処理段階では異体字の影響を与えないようにします。
本データのWeb上での検字には、SW.ttfをインストール後に一覧表から行ってください。
説文解字注データは、經韵樓臧版(上海古籍出版社)影印本を指定されたスキーマ(swjz.rnc)によるXMLで再構成しています。HTML化にあたっては、下図のような構成をとることを考慮しています。
swjz.xml 説文解字注データ |
>>> | swjz.xhtml 《XHTML Basic Structure》 |
|
↑検証 | ↑XHTML変換 | ↑配色・レイアウト | ↑UI |
swjz.rnc XMLスキーマ |
swjz.xsl XSLTスタイルシート |
swjz.css CSSスタイルシート |
swjz.js JavaScript |
なお本ファイルへの検索には、saryなどの巨大テキストファイルを高速に検索するツールを推奨します。以下はsary用にid値および親字にマッチするインデックスを作成するスクリプト例です。
#!/usr/bin/env ruby -Ku
# Usage: ruby swjz.rb < swjz.xml > swmz.xml.ary
file = $stdin
$offset=0
file.each_line{|line|
if line =~ /^(.+wordhead id=")(.+>).</
print [$offset+$1.length].pack("N")
print [$offset+$1.length+$2.length].pack("N")
end
$offset+=line.length
}
XHTML版
xhtml版は、xml版を上記スタイルシートに従ってxhtmlに変換したものです。
- 說文解字第一篇上
- 說文解字第一篇下
- 說文解字第二篇上
- 說文解字第二篇下
- 說文解字第三篇上
- 說文解字第三篇下
- 說文解字第四篇上
- 說文解字第四篇下
- 說文解字第五篇上
- 說文解字第五篇下
- 說文解字弟六篇上
- 說文解字第六篇下
- 說文解字第七篇
- 說文解字第七篇下
- 說文解字第八篇上
- 說文解字第八篇下
- 說文解字第九篇上
- 說文解字第九篇下
- 說文解字第十篇上
- 說文解字第十篇下
- 說文解字第十一篇上一
- 說文解字第十一篇上二
- 說文解字第十一篇下
- 說文解字第十二篇上
- 說文解字第十二篇下
- 說文解字第十三篇上
- 說文解字第十三篇下
- 說文解字第十四篇上
- 說文解字第十四篇下
参考文献
- 早稲田大学古典籍総合データベース「説文解字注. 第1-15篇 / 段玉裁 注」
- 中國哲學書電子化計劃「説文解字」
- BibLaTeXファイル
検索ツールについて
本データは現在、Lookup + Sary の 組み合わせにて、検索(単漢字・全文検索)を行うことができます。
Lookupのスクリーンショット例
Shuowen Jiezi Zhu Data
Shuowen Jiezi Zhu (説文解字注) Data is an attempt to encode "Shuowen Jiezi Zhu" written by Duan Yucai (段玉裁) in the UCS/Unicode. As of 2008, most of head characters are encoded, while some explanation and Duan notes have not yet been fully encoded. This data is originally produced by the research project funded by "Japan Society for the Promotion of Science" (2002-2004, Research ID 14510494). This data is distributed under GPL License.